Actualizaciones de objetivo periódicas y suaves estabilizan el Q-learning lineal
Descubre cómo las actualizaciones periódicas y suaves de objetivo garantizan la convergencia del Q-learning lineal, según un riguroso análisis teórico.
Descubre cómo las actualizaciones periódicas y suaves de objetivo garantizan la convergencia del Q-learning lineal, según un riguroso análisis teórico.